|
Extended Unix Code(EUC)は、UNIX上でよく使われる文字コードの符号化方式である。 *日本語EUC *JIS X 0208ベース (EUC-JP) *JIS X 0213ベース (EUC-JIS-2004) *韓国語EUC (EUC-KR) *簡体字中国語EUC (EUC-CN) *繁体字中国語EUC (EUC-TW) などがある。 == 概要 == バイト単位の可変長コードであるEUC Packed Formatと、2バイト固定長のEUC Fixed Width Formatがある。前者は情報交換用、後者は内部処理用で、一般にEUCという場合前者を指す。ここでも前者について解説する。 ISO/IEC 2022を基に、以下のようなサブセット化を行った体系である。 *G0にASCII(主コードセット)を、G1-G3に各言語の文字集合(補助コードセット1-3)を暗黙に指示する。指示のエスケープシーケンスは用いない。 *GLにG0を、GRにG1を暗黙に呼び出す。G2/G3はシングルシフト2/3によりGRに呼び出す。ロッキングシフトは用いない。 補助コードセットが0x80-0xFFの範囲で表されるため、主コードセットと衝突することがない。すなわちShift_JISにおける円記号問題のようなことが起きないというメリットがある。 具体的に局所化したそれぞれの版について、日本語では「 - 語EUC」や「 - 語版EUC」のように呼ばれることが多い。 抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)』 ■ウィキペディアで「Extended Unix Code」の詳細全文を読む 英語版ウィキペディアに対照対訳語「 Extended Unix Code 」があります。 スポンサード リンク
|